課程資訊
課程名稱
新聞資料分析
Data Analysis in Journalism 
開課學期
105-1 
授課對象
社會科學院  新聞研究所  
授課教師
謝吉隆 
課號
JOUR7085 
課程識別碼
342 M3010 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期五6,7,8(13:20~16:20) 
上課地點
新聞103 
備註
限學士班四年級以上
總人數上限:40人
外系人數限制:15人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1051webtech 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

1. 本課程主要對象為需要進行資料處理與分析的新聞所或傳播領域的學生。學生將知道如何搜集資料做為新聞報導的根據,包含政府開放資料或社群輿情,並自資料中發掘資料分佈與變化特徵來窺探事件現象的成因,藉以產製以資料為基礎的新聞報導。
2. 本課程主要目標為賦予學生有產製資料新聞的數據分析能力。故教學上將以實際案例應用與分析為主,而不著重在技術背景的統計與機率。
3. 課程內容涵蓋資訊處理軟體應用與R程式語言,主要要帶給學生獲取與處理資料、統計分析與文字或數據資料探勘的能力。
 

課程目標
1. 具有資料處理能力,包含獲取、儲存、轉換、與清理資料的能力。
2. 具有獲取政府開放資料與社群資料(例如facebook或ptt)的能力。
3. 具有利用R來對資料進行統計分析與資料探勘的能力。
4. 具有利用R來進行文字分析與探勘的能力。
 
課程要求
三、 每週進度及教學內容簡述(依週次依序填寫)
1. Overview. Installing development tools including RStudio, OpenRefine
2. Utilizing spreadsheet for data cleaning, analysis, and presentation (Microsoft Excel and Google Spreadsheet)
Example: Air Quality Index http://taqm.epa.gov.tw/taqm/en/default.aspx
3. Pivot table and useful functions in spreadsheet
Example: 內政部統計處各縣市歷年人口數統計
4. OpenRefine to import, convert, transform and clean data.
Verborgh, R., & De Wilde, M. (2013). Chap 2, 3.
5. Introduction to R and R dataframe
6. R for importing and exporting data. Reading data from government open data with CSV or JSON format.
Zhao, Y. (2012) Chap. 2.
ETC data as an example. http://cit-etc.net1.tw/download.html
7. R for importing and exporting data
Zhao, Y. (2012) Chap. 10.
Getting tweet data: Using twitter api
Getting facebook data by facebook graph api
8. R for graph presentation. Bar chart, line graph, box map, density curve, and scatter.
Chang, W. (2012). Chap. 2, 3, 4, 5
9. Data crawler with R (I): Crawling data from the web, PTT as a case study.
10. Data crawler with R (II): Crawling tabulating data from the web, stock information as an example.
11. Summary of Data cleaning with R
From raw data to technically correct data, e.g., converting date time, string processing.
From technically correct data to consistent data, e.g., missing values, special values, and outlier processing.
12. Data mining with R: regression
Zhao, Y. (2012) Chap. 5.
Curve-fitting
Example: flu data by Taiwan CDC
Integrating air pollution data and weather forecasting data for prediction
13. Case study I: Forecasting the rise and fall of house price in Taipei city.
14. Text mining with R: using twitter data as an example.
Zhao, Y. (2012) Chap. 10.
Stemming words
Building word frequency
15. Data mining with R: clustering. Detecting communities in social media: Using twitter data as an example. Also, how can we discover opinion polarization?
Zhao, Y. (2012) Chap. 6, 10
Word cloud
Clustering 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
待補 
參考書目
待補 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題